分享至
透過tokenizer.encode這個函數將文字轉換為對應的token編號。(Encode會自動加代表句子起始的符號(begin of text),不要它顯示的話就加add_specail_tokens=False。)
同一個英文單字,大小寫不同,token亦不同。
單字前有無空格也被視為不同token。
IT邦幫忙